
from langchain.document_loaders import PyPDFLoader
if __name__ == '__main__':

    # 创建一个 PyPDFLoader Class 实例，输入为待加载的pdf文档路径
    loader = PyPDFLoader("./第一回：Matplotlib初相识.pdf")
    # 调用 PyPDFLoader Class 的函数 load对pdf文件进行加载
    pages = loader.load()
    print(pages)

    print(type(pages))

    print(len(pages))

    page = pages[0]
    print(type(page))

    print(page.page_content[0:500])

    print(page.metadata)